Ejercicio de visualizacion de informacion con Pandas

Este es un pequenio ejercicio para revisar las diferentes graficas que nos permite generar Pandas.

  • NOTA: Utilizar el archivo df3 que se encuentra en la carpeta data

In [2]:
import pandas as pd
import matplotlib.pyplot as plt
df3 = pd.read_csv('../data/df3')
%matplotlib inline

In [3]:
df3.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 500 entries, 0 to 499
Data columns (total 4 columns):
a    500 non-null float64
b    500 non-null float64
c    500 non-null float64
d    500 non-null float64
dtypes: float64(4)
memory usage: 15.7 KB

In [4]:
df3.head()


Out[4]:
a b c d
0 0.336272 0.325011 0.001020 0.401402
1 0.980265 0.831835 0.772288 0.076485
2 0.480387 0.686839 0.000575 0.746758
3 0.502106 0.305142 0.768608 0.654685
4 0.856602 0.171448 0.157971 0.321231

Recrea la siguiente grafica de puntos de b contra a.


In [4]:



Out[4]:
<matplotlib.axes._subplots.AxesSubplot at 0x1176a7da0>

Crea un histograma de la columna 'a'.


In [5]:



Out[5]:
<matplotlib.axes._subplots.AxesSubplot at 0x1177a2860>

Las graficas se ven muy bien, pero deseamos que se vean un poco mas profesional, asi que utiliza la hoja de estilo 'ggplot' y genera el histograma nuevamente, ademas investiga como agregar mas divisiones.


In [6]:


In [7]:



Out[7]:
<matplotlib.axes._subplots.AxesSubplot at 0x11a87b908>

Crea una grafica de cajas comparando las columnas 'a' y 'b'.


In [8]:



Out[8]:
<matplotlib.axes._subplots.AxesSubplot at 0x1177c4a20>

Crea una grafica kde plot de la columna 'd'


In [9]:



Out[9]:
<matplotlib.axes._subplots.AxesSubplot at 0x11abb6278>

Crea una grafica de area para todas las columnas, utilizando hasta 30 filas (tip: usar .ix).


In [15]:



Out[15]:
<matplotlib.axes._subplots.AxesSubplot at 0x11ccdfbe0>